未分類

databricksのnotebookを使ってみよう その2

 

こんにちは。エクスチュアの松村です。

あいだが空いてしまいましたが、databricksのノートブックの魅力2回目
前回に引き続き、特長を紹介していきます

前回の記事はこちら

今回は、複数人で分析・開発していく「コラボレーション」を中心に紹介していきます。

3.複数人で同じノートブックへの同時編集、コメント

Databricksでは、複数人で1つのノートブックを同時に編集していくことができます。
GoogleDocsのように、同時に編集しながら編集内容がリアルタイムに反映されていきます。

また、コメント機能により作成したノートブックの内容をレビューしコメントするなどを実施できます。

これにより、複数人で同じDataFrameを同じノートブック内でそれぞれ実行したり、画面を見ながらペアプログラミングを実施したり、レビューしあうことができます。

4.ロギング 変更履歴の自動保存

Notebookを使っていて、「さっき作ったコード変更しちゃった。残しておけばよかった・・・」などということ、良くあるかと思います。
Databricksのノートブックは自動で変更履歴を残し、任意に戻すことや古いバージョンのノートブックからコードをコピーして持ってくることができます。

右上にある「Revision history」をクリックするだけで履歴がでてきます。
ここから変更したタイミングを選ぶと古いRevisionがでてきます。
指定したRevisionに戻すか、ここからコピーすることができます。

 

5.ノートブックをスケジュールジョブとして実行

機械学習を実施する際やETL処理を構築する際、JupyterNotebookでデータを見ながら作成した後、実行環境に実装する為に新たにコードを作成する というようなこと、よくやるかと思います。

Databricks ノートブックでは作成したノートブックをそのままスケジュールJOBとして登録することができます。

またスケジュールJOBを登録しば場合、実行するインスタンスはJOBを実行する時だけ起動して終了したらShutdownする為、利用コストも最小となります。

 

いかがでしたでしょうか。

弊社はデジタルマーケティングからビッグデータ分析まで幅広くこなすデータ分析のプロ集団です

ブログへの記事リクエストはこちらまでどうぞ。

databricksのnotebookを使ってみよう その1前のページ

Databricksが買収した8080Labのbamboolibをひと足早く使って見る次のページ

ピックアップ記事

  1. 最速で理解したい人のためのIT用語集

関連記事

  1. 未分類

    1st Party Cookieと3rd Party Cookieの違いと昨今の問題点をざっくり解説…

    はじめに昨今のデジマ業界において扱いが難しくなっているCoo…

  2. Data Clean Room

    PostgreSQLによるデータクリーンルームの可能性について

    こんにちは、喜田です。本投稿は PostgreSQL Adv…

  3. Mouseflow

    mouseflow の フリクションイベント って何?

    Webサイトの訪問者は、様々な理由でコンバージョン[閲覧者による収益…

  4. 未分類

    Databricksが買収した8080Labのbamboolibをひと足早く使って見る

    こんにちは、エクスチュアの松村です。先日、Databricks…

  5. Google Tag Manager

    【GA4/GTM】dataLayerを活用しよう

    はじめにこんにちは、エクスチュアの岩川です。GA4の…

  6. 未分類

    BigQueryで高額課金が発生しているクエリの呼び出し元を特定する

    こんにちは突然ですが、BigQueryで負の遺産を大…

カテゴリ
最近の記事
  1. Adobe WebSDK FPIDでECIDの復元を検証
  2. dbt Projects on Snowflakeで作成した…
  3. Dataformでtype:’increment…
  4. dbt Projects on SnowflakeをTASK…
  5. AWS発のAIエージェントIDE「Kiro」を使用した仕様駆…
  1. IT用語集

    テーブル(Table)・カラム(Column)・ロー(Row)・フィールド(Fi…
  2. Python

    その分析、やり方あってる?記述統計と推測統計の違い
  3. Adobe Analytics

    リアルタイムとは-Adobe Analyticsの指標説明
  4. Google Cloud Platform

    Looker: LookerbotをGoogle Cloud Platformで…
  5. Databricks

    databricksのnotebookを使ってみよう その1
PAGE TOP